SDXL 0.9 和 Midjourney 5.2 出图谁更好用？深度比较一文了解！

Original 行小曦曦语子 2024-06-01

点击上面蓝色字体关注设为星标

小版本更新迭代的加速，这也预示着AI 工具混战的加速。但是对于用户是好事情，有竞争才有进步嘛。StabilityAI 和 Midjourney 可谓是暗自较劲。除此之外还有Playground AI、GoogleBard、Adobe Firefly等等至少有30多个工具在加速跑。

可以说是不只是各行各业，现在的AI工具也在卷，抢占市场和占有率，你有的功能我要有，你没有的我也要有，而且比你的更好用。目测也许7月份将是各类AI工具一个更新迭代的大月份。用户静需等待就好。

Midjourney v6、

SDXL v 1.0、

Google StyleDrop、

DragGan、

Google Bard+ AdobeFirefly、

SDXL v0.9 VS Midjourney 5.2 ：

下面就几个用户吐槽的问题和改进的功能点，

还有商业应用上案例来整体比较看看：

左边：Stable Diffusion XL (SDXL) v0.9

右边：Midjourney 5.2

旧版本出图过程中用户需要输入特定关键词

才能实现的全身像或者图像的扩充

现在可以一键缩放扩充图像内容

提升图像创意想象空间操控性

很多用户抱怨的两个点：一个是手的不稳定，手臂手指凌乱，一个是裁切的画面不完善，还有一个就是连续性的创作主题不稳定，就算是用seed值或者iw参数也不稳定：

在设计/出图/大场景方面，AI会裁切掉过多的画面，人物或者物体也需要输入特定的关键词，多次实验后逐步完善才可以得到完成的场景。而缩小功能的加入彻底改变这一情况。

Midjourney V5.2 ：

虽说是小版本的迭代，但是为了提高用户的体验感受，为了更好方便用户扩充图像和想象空间。

MJ 在用户的操控性创意性上入手，缩放功能的加入可以更加自如控制画面。同时引入了新的美学系统、更高更好的清晰度，高变化模式。

Stable Diffusion XL (SDXL) v0.9 ：

提升图像超真实感，同时也提升了输出分辨率，在复杂度和视觉质量方面超越了之前的迭代。

SDXL 0.9 还支持除简单文本提示之外的多种功能。其中包括图像到图像提示（输入一个图像以获取该图像的变体）、修复（重建图像的缺失部分）和修复（构建现有图像的无缝扩展）。

因此：图像放大缩小扩充两者都可以实现。

MJ 5.2 缩放功能= adobe firefly 自动填充功能。

MJ 5.2 在 / --NIJI 模式下，

同时+ 缩小功能可以得到，

更为震撼的新海诚/宫崎骏/风格大场景：

用户抱怨最多的问题

面条手/薛定谔的手的问题

Stable Diffusion XL (SDXL) v0.9 ：

随着大量的模型数据的增加，深度学习的性能也在增强，小版本的迭代也在逐步修复这个问题，就是调教修复人物和动物手的问题，不会经常产生那些讨厌的“面条手或奇形怪状的多手指”。这也是用户抱怨最多的问题之一。

而在Midjourney V5.2中：

Midjourney 对于人物手臂和手的细节问题，目前还看不到明显的改变，又或者是我们就等待V6大版本的迭代，再看它的效果，加入Draggan功能的大迭代。

吐槽最多的手的问题：SD可通过插件可以逐渐修正，而MJ目前还看到太多的改进。

扩展阅读：

Midjourney V6马上来了！

三个强大新功能将颠覆AI绘图！

薛定谔的手指，

数数看到底有多少个手指！

左图：Stable Diffusion XL (SDXL) v0.9

右图：Midjourney 5.2

人物写实风格上的差异

开源 + 插件的应用

在人物写实风格的比较上，开源的Stable Diffusion 明显好于 Midjourney，景深深度合成方面Stable Diffusion 更胜一筹。

像Stable Diffusion 的插件Controlnet 常被用于人像生成中引导手部生成使用。可以很好的解决大型开源模型的某些细节问题。

而Midjourney似乎更倾向于创意灵感的发挥。也不是说MJ不适合做人物，niji模式下Mj也可以做到快速生成某些风格。

人物写实风格上的差异

开源 + 插件的应用

在人物写实风格的比较上，开源的Stable Diffusion 明显好于 Midjourney，景深深度合成方面Stable Diffusion 更胜一筹。

像Stable Diffusion 的插件Controlnet 常被用于人像生成中引导手部生成使用。可以很好的解决大型开源模型的某些细节问题。

而Midjourney似乎更倾向于创意灵感的发挥。也不是说MJ不适合做人物，niji模式下Mj也可以做到快速生成某些风格。

>> 下图：

左手是正常的，右手还是薛定谔：

商业化应用到底谁好？

人物、创意、各有春秋、

现在随着AI的应用越来越广，

越来越多的店铺采用“AI人”展示店铺服装商品。

而这一方面SD也是更甚一筹。在人物稳定性上，Stable Diffusion 也是更胜一筹。SD在做写实人物方面本身就具有优势。依靠稳定的模型参数直接出成套的图，换产品比较方便。

而Mj连续创作上就非常不稳定，尤其是人物偶尔还会发生“变异”。简单的换衣还是可以完成的。但是MJ在创意方面确实很不错，尤其是广告美术设计墙绘电商服装出版刊物、室内设计等等50几个行业已经有了很大的影响力。

>> 上图：注意看敦煌飞天的手。

图：ChatAiRen

AI 敦煌小姐姐的魔法咒语：

Prompt TXT2IMG

1 girl,dunhuang_cloths,dunhuang_style,best quality, realistic, photorealistic, award-winning illustration, (intricate details:1.2), (delicate detailed), (intricate details), (cinematic light, best quality Backlights), clear line,fashion girl, sharp focus, realistic face,detailed face,official art, unity 8k wallpaper, ultra high res, (photorealistic:1.5), looking at viewer, ulzzang-6500 <lora:style_dunhuang:1> <lora:koreandolllikenessV20_v20:1>

Negative prompt: blurry background,depth of field,paintings, sketches, (worst quality:2), (low quality:2), (normal quality:2), lowres, normal quality, ((monochrome)), ((grayscale)), skin spots, acnes, skin blemishes, age spot, (outdoor:1.6), manboobs, backlight, double navel, mutad arms, hused arms

Size: 512x768,

Seed: 310006196,

Model: chilloutmix_NiPrunedFp32Fix,

Steps: 40,

Sampler: DPM++ SDE Karras, CFG scale: 7,

Model hash: fc2511737a, Hires upscale: 2,

Hires upscaler: R-ESRGAN 4x+,

Face restoration: CodeFormer,

Denoising strength: 0.1

Stable Diffusion SDXL 0.9：

增强提示感知改善图像细节。

图像更为高清。